全网首发,Meta Llama-3 全方位详解
10 分钟前
Meta 发布了 Llama 3
「赛博禅心」第一时间带来详细报道
关于 Llama
Llama 是由 Meta(FaceBook) AI 发布的一个开源项目,允许商用,影响力巨大。之前发布的 Llama 2,支持 4096 上下文,性能卓越,被认为是 GPT 系列最大的竞争对手(之一)。
Llama-3
Meta 发布了 Meta Llama 3 系列语言模型(LLM),具体包括一个 8B 模型和一个70 B模型在测试基准中,Llama 3 模型的表现相当出色,在实用性和安全性评估中,与那些市面上流行的闭源模型不相上下。
第 1 部分
刚刚发布的 Llama-3
中国时间 2024 年 4 月 19 日 0 点 0 分,Meta Llama 3 发布。模型以开源形式提供,包含 8B 和 70B 两种参数规模,涵盖预训练和指令调优的变体。Llama 3 支持多种商业和研究用途,并已在多个行业标准测试中展示了其卓越的性能。
技术信息
Transformer 架构
Meta Llama 3 采用了优化的自回归 Transformer 架构,这种架构专为处理复杂的文本生成任务设计,能够有效提升生成文本的连贯性和相关性。
混合调优
模型结合了监督式微调(SFT)和带人类反馈的强化学习(RLHF),这种混合方法不仅增强了模型的帮助性,也提高了安全性,使得模型在实际应用中更加可靠和符合用户预期。
性能卓越
在多个行业标准基准测试中,特别是在对话类应用中,Meta Llama 3 的表现超过了许多现有的开源聊天模型,显示了其强大的应用潜力,具体后面细说。
数据训练
大的数据
Llama 3 使用了超过 15 万亿令牌的公开在线数据进行预训练,这些数据经过精选,确保模型训练的广泛性和高质量输出。
新的数据
8B 版本数据更新截止至 2023 年 3 月,而 70B 版本则更新至同年 12 月。
30 种语言
虽主要以英语为主,但预训练数据中包含超过 30 种语言的高质量非英语数据
* 大聪明:中文数据不知道用没用「弱智吧」语料
政治正确(雾
碳排放抵消
Meta 承诺通过其可持续性计划抵消预训练过程中产生的所有 CO2 排放(2290 吨 CO2 等效)。
很守规矩
Llama 3 的使用严格遵守法律法规,确保不被用于任何非法活动,同时强调了对知识产权和合规性的重视。
第 2 部分
技术性能
这次的 Llama 在性能上展现了大幅度提升,包括最直接的 8k 上下文(之前是4k),以及可以更好的完成输出任务。
性能测试
基准测试
Meta Llama 3 的 70B 模型在多项基准测试中显示出色的性能,例如在 TriviaQA-Wiki 测试中达到了 89.7% 的准确率,明显优于其他同规模模型。
在内部开发的高质量人类评估集中,该评估集包含了 1,800 个提示,覆盖了 12 个关键用例(包括咨询、编码、创意写作等),Llama 3 在这些实际应用场景中的表现同样卓越。
这里再附一张 Llama 2 和 3 的对比:
现实场景
根据人类评估者的偏好排名,Llama 的 70B 参数模型在实际应用场景中的表现,尤其是在指令跟随方面,相较于其他相当规模的模型表现出了显著的优势。
架构与优化
模型架构
Llama 3 采用了自回归 Transformer 架构,这种结构特别适合于处理复杂的文本生成任务,能有效提升文本的连贯性和相关性。
引入了分组查询注意力(Grouped Query Attention, GQA)技术,这不仅提升了大数据处理的效率,还加快了响应速度。
训练和微调
在预训练阶段,Llama 使用了超过 15 万亿令牌的高质量数据集,包括多种语言的文本,以确保模型具有广泛的适用性和优异的性能。
在微调阶段,通过监督式微调(SFT)和带人类反馈的强化学习(RLHF)的混合方法,Llama 显著降低了错误拒绝率,改善了模型的对齐和响应多样性。
性能提升
Llama 3 在本次更新中,于推理、代码生成和指令跟随等方面有了明显的能力提升。
第 3 部分
在哪能用
作为一个开源 LLM,你可以通过多种方式来使用:直接用别人部署好的产品,找部署好的接口,或者自己部署
中文还是有问题
直接使用(最简单)
Hugging Face
地址在这,进去后直接切模型:https://huggingface.co/chat/
Replicate
8B 模型:hat/https://replicate.com/meta/meta-llama-3-8b
70B 模型:https://replicate.com/meta/meta-llama-3-70b
(刚放上去,只运行了 8 次)
Meta AI
Meta 自己拿 Llama 3 做的,这里访问:https://ai.meta.com/
注意,这个锁地区。
第三方 API
微软 Azure
地址在这:https://azuremarketplace.microsoft.com/en-us/marketplace/apps/metagenai.meta-llama-3-8b-chat-offer?tab=overview
Replicate
他们好卷...Llama 发布1个小时,他们就上线服务了,这俩地址也能走 API
8B 模型:hat/https://replicate.com/meta/meta-llama-3-8b
70B 模型:https://replicate.com/meta/meta-llama-3-70b
自己部署
Meta 项目官网
地址在这:https://llama.meta.com/llama-downloads
Github
项目地址:https://github.com/meta-llama/llama3
第 4 部分
其他
跟随 Llama 3 发布的,还有 Meta AI 系列,包括:一款手机app,一个网站,还有一堆在 Meta FaceBook 全家桶里的插件
* 大聪明:从中国取的经吧?
APP 能干啥
能当 ChatGPT 用
emmmmm...
网页应用能干啥
还是能当 ChatGPT 用
emmmmm...
插件能干啥
能在全家桶里用
这个看上去很实用!
以上
由本「大聪明」报道
下次还是我🤔